فیلترها/جستجو در نتایج    

فیلترها

سال

بانک‌ها



گروه تخصصی









متن کامل


اطلاعات دوره: 
  • سال: 

    1395
  • دوره: 

    8
تعامل: 
  • بازدید: 

    472
  • دانلود: 

    371
چکیده: 

کشف توالی های پرتکرار یکی از وظایف داده کاوی است که دارای کاربردهای فراوانی است. یافتن این توالی ها معمولا با تولید توالی های کاندید و چک کردن تعداد تکرار آنها همرا می باشد که زمان بر است. ...

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 472

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 371
نویسندگان: 

FALLAH MAHDIEH | ZARIFZADEH SAJJAD

اطلاعات دوره: 
  • سال: 

    2018
  • دوره: 

    10
  • شماره: 

    2
  • صفحات: 

    63-71
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    186
  • دانلود: 

    0
چکیده: 

Most of today’ s Internet services utilize user feedback (e. g. clicks) to improve the quality of their services. For example, search engines use click information as a key factor in document ranking. As a result, some websites cheat to get a higher rank by fraudulently absorbing clicks to their pages. This phenomenon, known as “ click spam” , is initiated by programs called “ click Bot” . The problem of distinguishing bot-generated traffic from the user traffic is critical for the viability of Internet services, like search engines. In this paper, we propose a novel classification-based system to effectively identify fraudulent clicks in a practical manner. We first model user sessions with three different levels of features, i. e. session-based, user-based and IP-based features. Then, we classify sessions with two different methods: a one-class and a two-class classification that both work based on the well-known K-Nearest Neighbor algorithm. Finally, we analyze our methods with the real log of a Persian search engine. Experimental results show that the proposed algorithms can detect fraudulent clicks with a precision of up to 96% which outperform the previous works by more than 5%.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 186

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
اطلاعات دوره: 
  • سال: 

    1398
  • دوره: 

    8
  • شماره: 

    2
  • صفحات: 

    1-16
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    664
  • دانلود: 

    190
چکیده: 

یکی از عوامل اصلی در تصمیم گیری مشتریان برای خرید یک محصول یا استفاده از خدماتی خاص، استفاده از نظرات برخط است. این گونه از نظرات منابعی ارزشمند از اطلاعات هستند که برای تشخیص افکار عمومی در مورد محصول یا خدمات استفاده می شوند. اگرچه نظرات برخط می توانند مفید باشند اما اعتماد کورکورانه به آن ها، هم برای فروشنده و هم برای خریدار خطرناک است زیرا ممکن است برای به دست آوردن سود، دستکاری شده باشند که اصطلاحاً به این گونه نظرات « نظرات اسپم» گفته می شود. پژوهش حاضر روی نظرات فارسی ثبت شده در مورد تلفن همراه در وب سایت دیجی کالا انجام شده و از میان انواع اسپم، اسپم نوع یک و دو بررسی شده اند که نوع اول نظرات جعلی و نوع دوم نظراتی هستند که تنها در رابطه با مدل کالا نوشته شده اند. ویژگی های مورد استفاده در این پژوهش به علت کارا بودن آن ها در دسته بندی، شامل ویژگی های مبتنی بر نظر و ویژگی های فراداده است. این ویژگی ها و نیز ترکیب های متفاوت از آن ها در تشخیص نظرات اسپم فارسی و تأثیر آن ها روی دقت دسته بند بررسی شده است. دسته بندی توسط درخت تصمیم، دسته بند ماشین بردار پشتیبان و دسته بند نایو بیز انجام شده و در نهایت دقت آن ها روی ترکیب های مختلف این ویژگی ها با هم مقایسه گردیده است. بالاترین میزان دقت به دست آمده از سه دسته بند توسط درخت تصمیم حاصل می شود که برابر با با 778/0 براساس معیار اِف است. در رتبه دهی به ویژ گی ها باز هم درخت تصمیم با دقت 824/0 و با ترکیب سه ویژگی بازخوردهای مثبت، امتیاز کلی کالا و قطبیت نظر رتبه ی برتر را به خود اختصاص می دهد.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 664

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 190 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources
اطلاعات دوره: 
  • سال: 

    1403
  • دوره: 

    22
  • شماره: 

    4
  • صفحات: 

    287-294
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    40
  • دانلود: 

    0
چکیده: 

امروزه موتورهای جستجو دروازه ورود به وب هستند. با افزایش محبوبیت وب، تلاش برای بهره‌برداری تجاری، اجتماعی و سیاسی از وب نیز افزایش یافته و در نتیجه تشخیص یک محتوای خوب از اسپم برای موتورهای جستجو دشوار شده است. مفهوم اسپم وب نخستین بار در سال 1996 معرفی شد و خیلی زود به عنوان یکی از چالش‌های کلیدی برای صنعت موتور جستجو شناخته شد. پدیده اسپم اساساً به این دلیل اتفاق می‌افتد که بخش قابل توجهی از مراجعات به صفحه وب از موتور جستجو می‌آیند و کاربران تمایل به بررسی اولین نتایج جستجو دارند. هدف از شناسایی صفحات اسپم این است که این صفحات با استفاده از استراتژی‌های فریب قادر به کسب رتبه بالا نباشند. تلاش ما ارائه روشی مؤثر در شناسایی صفحات اسپم و در نتیجه کاهش حضور اسپم در نتایج اول جستجوست. در این مقاله دو روش برای مقابله با اسپم وب پیشنهاد شده است. روش اول به نام XGspam صفحات اسپم را بر اساس الگوریتم یادگیری XGBoost با دقت 27/94% شناسایی می‌کند. در روش دوم به نام XGSspam راهکاری برای چالش نامتوازن‌بودن داده‌های وب با استفاده از ترکیب الگوریتم بیش‌نمونه‌برداری SMOTE با مدل دسته‌بندی XGBoost ارائه شده که به دقت 44/95% در شناسایی صفحات اسپم می‌رسد.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 40

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
اطلاعات دوره: 
  • سال: 

    1402
  • دوره: 

    30
  • شماره: 

    24
  • صفحات: 

    63-78
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    46
  • دانلود: 

    0
چکیده: 

پیام های تجاری ناخواسته (اسپم) به صورت الکترونیکی و انبوه، بدون رضایت گیرنده، از طریق ابزاری چون رایانامه یا پیامک ارسال می-شود. اسپم در کنار مزایایی که برای تبلیغ کنندگان دارد، می تواند موجب نقض حریم خصوصی کاربران اینترنت و تلفن همراه شود و زیان اقتصادی و نارضایتی گسترده مصرف کنندگان و حتی تجار را در پی داشته باشند. امری که در کنار احتمال اخلال در عملکرد سامانه هایی از قبیل رایانامه و پیام کوتاه، ممکن است به بی اعتمادی نسبت به تجارت الکترونیکی و اقتصاد دیجیتال منجر شود. نتایج این مقاله توصیفی-تحلیلی نشان می دهد برخی کشورها ارسال اسپم را حتی بدون رضایت مخاطب مجاز و مخالفت بعدی وی را مانع ارسال می دانند که شیوه کناره گیری نامیده می شود. کشورهای دیگر، اعلام رضایت قبلی مخاطب را ضروری می دانند که به شیوه مشارکتی معروف است. دو شیوه یادشده، از طریق سه رویکرد تقنینی همراه با تساهل، معتدل و سختگیرانه اعمال می شود که با توجه به نحوه برخورد با ارسال کنندگان اسپم و ضمانت اجراها، تقسیم بندی و نامگذاری شده اند. موضع حقوق ایران راجع به ممنوعیت یا مجازبودن ارسال اسپم چندان واضح نیست. در این مقاله، تصویب قانون یا برخی مواد قانونی صریح و شفاف راجع به اسپم، با اتخاذ شیوه مشارکتی و پیش بینی ضمانت اجراهای کارآمد در ایران پیشنهاد شده است.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 46

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
اطلاعات دوره: 
  • سال: 

    2023
  • دوره: 

    9
تعامل: 
  • بازدید: 

    115
  • دانلود: 

    0
چکیده: 

One of the most accessible ways to communicate via text is through a short message service. In recent years, profit-seeking people have taken advantage of the good features of this service to send large numbers of spam messages to random people for malicious purposes. In this respect, detecting spam messages is an important task. The unbalanced proportion of the spam and ham data and the extraction of efficient features from short messages have been the main challenges in the SMS spam detection problem. So far, various methods have been proposed to filter spam messages, whose accuracy still needs to be improved. In this study, we propose an ensemble learning method based on random forest and logistic regression algorithms to increase the accuracy of SMS spam detection. The proposed approach has been tested on two real datasets. The experimental evaluation based on accuracy and AUC shows the effectiveness of the proposed ensemble learning algorithm.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 115

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 0
مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources
اطلاعات دوره: 
  • سال: 

    2019
  • دوره: 

    5
تعامل: 
  • بازدید: 

    179
  • دانلود: 

    0
چکیده: 

TODAY, SOCIAL NETWORKS HAVE PROVIDED A SUITABLE PLATFORM FOR SOCIAL RELATIONSHIP. AMONG ONLINE SOCIAL NETWORKS, TWITTER HAS BECOME A POPULAR PLATFORM FOR INFORMATION DIFFUSION AROUND THE WORLD. DUE TO POPULARITY OF TWITTER, IT HAS BEEN TARGETED BY spamMERS AND MALICIOUS ACTIVITIES. IN THIS REGARD, SEVERAL STUDIES HAVE BEEN CONDUCTED USING MACHINE LEARNING TECHNIQUES BY RESEARCHERS TO REACH PROMISING RESULTS. IN RECENT YEARS, ENSEMBLE LEARNING ALGORITHMS HAVE BEEN PRESENTED AS ONE OF THE MODERN MACHINE LEARNING TECHNIQUES, DUE TO ITS HIGH ACCURACY, FOR DATA MINING. IN THIS PAPER, WE PROPOSE A DATA MINING FRAMEWORK USING ENSEMBLE LEARNING FOR spam DETECTION IN TWITTER. IN THE PROPOSED METHOD, AFTER DATA COLLECTION, PREPROCESSING, FEATURE EXTRACTION AND FEATURE SELECTION, THE CLASSIFICATION IS CONDUCTED BY ENSEMBLE LEARNING USING THE DECISION TREE, K-NEAREST NEIGHBOR AND NAï VE BAYES. THE SIMULATION RESULTS ARE COMPARED WITH OTHER CLASSIFICATION ALGORITHMS.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 179

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 0
اطلاعات دوره: 
  • سال: 

    1403
  • دوره: 

    21
  • شماره: 

    4
  • صفحات: 

    284-290
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    118
  • دانلود: 

    24
چکیده: 

امروزه شبکه های اجتماعی، نقش مهمی در گسترش اطلاعات در سراسر جهان دارند. توییتر یکی از محبوب ترین شبکه های اجتماعی است که در هر روز 500 میلیون توییت در این شبکه ارسال می شود. محبوبیت این شبکه در میان کاربران منجر شده تا اسپمرها از این شبکه برای انتشار پست های هرزنامه استفاده کنند. در این مقاله برای شناسایی اسپم در سطح توییت از ترکیبی از روش های یادگیری ماشین استفاده شده است. روش پیشنهادی، چارچوبی مبتنی بر استخراج ویژگی است که در دو مرحله انجام می شود. در مرحله اول از Stacked Autoencoder برای استخراج ویژگی ها استفاده شده و در مرحله دوم، ویژگی های مستخرج از آخرین لایه Stacked Autoencoder به عنوان ورودی به لایه softmax داده می شوند تا این لایه پیش بینی را انجام دهد. روش پیشنهادی با برخی روش های مشهور روی پیکره متنی Twitter spam Detection با معیارهای Accuracy،-Score1F، Precision و Recall مورد مقایسه و ارزیابی قرار گرفته است. نتایج تحقیق نشان می دهند که دقت کشف روش پیشنهادی به 1/78% می رسد. در مجموع، این روش با استفاده از رویکرد اکثریت آرا با انتخاب سخت در یادگیری ترکیبی، توییت های اسپم را با دقت بالاتری نسبت به روش های CNN، LSTM و SCCL تشخیص می دهد.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 118

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 24 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
نویسندگان: 

HANKE MICHAEL | HAUSER FLORIAN

اطلاعات دوره: 
  • سال: 

    2008
  • دوره: 

    11
  • شماره: 

    -
  • صفحات: 

    57-83
تعامل: 
  • استنادات: 

    1
  • بازدید: 

    107
  • دانلود: 

    0
کلیدواژه: 
چکیده: 

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 107

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 1 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
نویسندگان: 

SHEIKHI S. | Kheirabadi M. T. | Bazzazi A.

اطلاعات دوره: 
  • سال: 

    2020
  • دوره: 

    33
  • شماره: 

    2 (TRANSACTIONS B: Applications)
  • صفحات: 

    221-228
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    278
  • دانلود: 

    0
چکیده: 

In recent years, there has been considerable interest among people to use short message service (SMS) as one of the essential and straightforward communications services on mobile devices. The increased popularity of this service also increased the number of mobile devices attacks such as SMS spam messages. SMS spam messages constitute a real problem to mobile subscribers; this worries telecommunication service providers as it disturbs their customers and causes them to lose business. Therefore, in this paper, we proposed a novel machine learning method for detection of SMS spam messages. The proposed model contains two main stages: feature extraction and decision making. In the first stage, we have extracted relevant features from the dataset based on the characteristics of spam and legitimate messages to reduce the complexity and improve performance of the model. Then, an averaged neural network model was applied on extracted features to classify messages into either spam or legitimate classes. The method is evaluated in terms of accuracy and F-measure metrics on a real-world SMS dataset with over 5000 messages. Moreover, the achieved results were compared against three recently published works. Our results show that the proposed approach achieved successfully high detection rates in terms of F-measure and classification accuracy, compared with other considered researches.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 278

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
litScript
telegram sharing button
whatsapp sharing button
linkedin sharing button
twitter sharing button
email sharing button
email sharing button
email sharing button
sharethis sharing button